17例样本全基因组测序就能发高分?看高手如何揭示疾病潜在风险因子!
近日,英国牛津分子诊断中心、NIHR医学研究中心、挪威Skåne大学医院和比利时布鲁塞尔大学等多所研究机构,在Blood杂志上联合发表了题为“Genomic and transcriptomic correlates of Richter’s transformation in Chronic Lymphocytic Leukemia”的文章。该研究仅用了17例临床实验患者的配对样本进行了全基因组测序(WGS)和转录组Nanostring表达分析,却能发表一篇影响因子17.5分的文章,这是如何做到的呢?
高分亮点解析
第一点原因是样本和病例的稀缺性,慢性淋巴细胞白血病(CLL)转化为高度B细胞淋巴瘤被称为Richter综合征(RS),该症状较为罕见,预后不佳。而且由于RS具有典型的体内肿瘤异质的特征,难以构建合适的体外模型,为新药的开发也带来挑战。之前的研究是基于9个RS病人的外显子和基因芯片数据得到的结果,但由于缺乏生殖系样本,只能得到在RS和CLL中都发生突变的基因。
第二点原因是严密的队列设计和多组学验证办法,本文研究团队构建了发现队列和独立的验证队列:将标准的CHOP-R(cyclophosphamide, doxorubicin, vincristine, prednisolone and rituximab)临床疗法中的利妥昔单抗替换为ofatumumba(奥法木单抗),对接受临床试验的17例CLL病人(发现队列)的血液样本和RS FFPE样本(石蜡包埋样本)以及唾液(胚系样本)进行高深度(40-80X)全基因组测序,并对其中12人(验证队列)的淋巴结和RS FFPE进行转录组分析验证以及非编码区的染色质开放性分析(ATAC-Seq),为发现促使RS转化的遗传因素提供分子证据。
图1 项目设计流程图
主要研究成果
1. CHOP-O cohort基因变异检测整体情况
测序结果发现,在经过过滤的CLL外周血(PB-CLL)和TISSUE-RS(tissue-RS)的全基因组数据中,非重排T细胞受体中没有被发现存在破坏性的体细胞突变,说明该治疗策略是有效果的。在排除掉极值的数据中共发现有害体细胞突变529个,而其中tissue-RS的SNV及InDel要比PB-CLL中的更多。
2. TISSUE-RS比PB-CLL在基因组层面发生更多变异
研究发现,相比PB-CLL,44个已知的CLL驱动基因在TISSUE-RS上发生更高频率的突变。且相比PB-CLL,TISSUE-RS中的异常DDR(DNA损伤应答)基因数量也更高,TISSUE-RS中有79个频发基因受到SNVs(单核苷酸位点变异)/InDels(插入和缺失)或CNAs(体细胞拷贝数变化)的影响。接下来,作者团队使用严格的过滤器对TISSUE-RS中所有频发基因进行了GWAS分析,在DUSP2、SVIL、CDKN2A、DND1、DNER、IGSF3等18个基因中鉴定到新的频发性SNVs/InDels位点。
图2 CLL驱动基因,DDR以及频发性基因在PB-CLL和tissue-RS上的SNV/InDel和CNA数情况
3. RS中新发现的突变基因
研究团队发现,超过半数的患者样本中带有频发性的MYC畸变和错义突变驱动因素。还有一类基因,在RS中呈现为频发突变,但在CLL中突变频率较低,其中就包括之前未曾发现的TRAF3和PTPRD。TRAF3表达的缺乏会通过上调PIM3和c-MYC表达增强B细胞的生存率,增加转化风险。PTPRD是一种肿瘤抑制基因,其变异会引起STAT3通路失调。还有一些候选基因在本次研究的TISSUE-RS中大量存在(图3)。
图3 TISSUE-RS上频发突变基因的SNV,InDel和CNA分布情况
4. MAPK-RAS-ERK和DDR通路中的基因主导RS转化
有假说认为,携带频发突变基因的克隆会优先扩张,具有更强的生存优势。文章研究了PB-CLL和TISSUE-RS样本对之间的克隆进化模式,发现存在MAPK-RAS-ERK 和 DDR pathways中的突变基因克隆扩张的可能性确实高于收缩。基于通路的分析发现,克隆扩张突变的MAPK基因有TP53、DUSP2、BRAF、KRAS、GNA12、CACNA1D和CACNA1H;DDR基因有TP53 , MUTYH及RPS27A。
5. 利用多组学方法验证克隆扩张突变基因位点
为了做进一步验证研究,研究团队检查了在克隆分析中看到的DDR、MAPK突变是否在基因表达上也能反映出来,所以后续又做了Nanostring表达分析。Pathway富集分析表明,包含克隆扩增突变的DDR基因以及MAPK基因在转化过程中大部分都显著上调,验证了前面的发现。
6. 突变热点发生在非编码调控区
该研究还用大量篇幅描述了非编码区变异。Kataegis指的是在癌症基因组中发现的突变热点区域,本次基于CLL和RS样本的比较发现,每个TISSUE-RS中都可以找到至少一个kataegis,而在CLL样本对中是缺失的。利用ATAC-Seq数据结果,研究人员在TISSUE-RS中发现了与AID(激活诱导胞啶脱氨酶)相关或不相关的kataegis位于关键免疫调节基因的调控区,包括BTG2、CXCR4、NFATC1、PAX5、NOTCH-1、SLC44A5、FCRL3、SELL、TNIP2和TRIM13这些区域的启动子、内含子、增强子及可变剪切区域。总而言之,TISSUE-RS中启动子/增强子SNV要明显多于PB-CLL。
图4 用Alexandrov和SeqKat法找到的通过启动子和增强子与Kataegis区域相连的基因
综上,本研究针对三大内容进行了充分研究:第一,分析从CLL到RS的克隆进化,以及造成克隆扩张的相关基因变异;第二,研究转录组并验证上述确定的基因Pathway;第三,患者特异性DNA突变和RNA表达的比较验证。由此揭示了DDR和MAPK基因的变异是造成癌症转化的主要因素;TISSUE-RS相比较PB-CLL在编码区具有更高的肿瘤突变负荷(TMB);TMB在非编码区域发生更高频率的突变(kataegis);肿瘤克隆中含有在MAPK-RES-ERK和DDR通路中的基因突变会在癌症转化中更容易发生扩张。本文发现的潜在基因将为未来新药开发提供具体的靶点信息,为临床医生在实际治疗过程中提供更多的参考和决策依据。
华大DNBSEQ自主平台结合人全基因组测序产品专属计算集群、BGI Online、MegaBOLT等计算系统,可为科研用户提供高性价比、快速、高集成度的专业服务,满足不同层次的科研需求,轻松处理PB级数据,为中国人群精准医学大数据的研究与应用提供综合技术支撑。
基于DNBSEQ平台的WGS,拥有高准确度和敏感度、超低Dup率、无index hopping担忧等优点,为广大科研工作者提供了极具性价比的一站式基因组研究方案,支持大队列研究,助力精准医学!
自主平台WGS极致交付,仅需10天!
加速不加价,成本可控质更优!
原文链接:
https://doi.org/10.1182/blood.2020005650
近期热文
新历启封,2021新品抢先看!过去一年这些热门产品,您都享用了吗?
“华大科技服务”服务号已开通,下方扫码即可关注~
科技君将持续为您提供精彩内容
如有问题,欢迎后台留言~~
▼
点击“阅读原文”了解华大WGS产品